La validation croisée est une méthode permettant de mesurer la fiabilité d'un classifieur. Elle consiste à découper
les données en deux sous-échantillons de façon aléatoire. On utilise un des deux échantillons comme données d'apprentissage 
({\em échantillon d'entraînement}) et l'autre échantillon comme données inconnues à classer ({\em échantillon de validation}). On 
peut ainsi déterminer le pourcentage de données bien classées. On doit recommencer l'opération en faisant un autre découpage aléatoire sur les 
mêmes données pour obtenir une sensibilité moyenne.
~\\

Pour le projet, la validation croisée a été faite pour les {\em Hexapoda}\footnote{Sous-embranchement regroupant les insectes} et
les {\em Vertebrata}\footnote{Sous-embranchement regroupant les vertébrés}. On a choisi un découpage de 75\% pour l'échantillon d'entraînement et mesuré le pourcentage de données bien classées. Cette opération 
a été répétée dix fois afin d'obtenir une assez bonne mesure de la sensibilité moyenne. On a repris le langage Perl afin de générer les échantillons d'apprentissage et d'entraînement.

L'échantillon de validation étant déjà bien classé, Weka va automatiquement calculer le pourcentage d'instances bien classées en comparant la nouvelle classe obtenue et l'ancienne classe (la bonne).
